1
Токенизация и последовательности
EvoClass-AI004Лекция 4
0
🤖
Бип-боп! Добро пожаловать, кадет! Выберите подтему ниже, чтобы увидеть, как ИИ «читает» с помощью токенизации.
Команда Пай-ботаВ ЭФИРЕ
Бип-боп! Привет, кадет! Чтобы научить ИИ читать, мы сначала должны разрезать слова на мелкие «Лего»-блоки. Готовы узнать, как компьютеры превращают слова в числа?
Прогресс темы0%
Отличный выбор! Токен — это как кубик Лего. Слова, такие как «дружба», делятся на более мелкие части, такие как «друг» и «корабль». Даже простая точка — это токен! Для ИИ эти части легче обрабатывать, чем длинные предложения целиком.
1
Подтема 1
Что такое токен?
Разрезание текста на мелкие строительные блоки, такие как «друг» и «корабль».
Посмотрите на это! Как только у нас есть токены, ИИ присваивает каждому из них секретный номер идентификации. Эти числа образуют «последовательность». Помните: порядок имеет значение! «Собака укусила человека» и «Человек укусил собаку» используют одни и те же блоки, но последовательность рассказывает совершенно другую историю!
2
Подтема 2
Сила последовательностей
Преобразование блоков в математический список, где важен каждый порядок.
Знаете ли вы? У ИИ есть «окно контекста», которое похоже на размер его ладони. Оно может хранить только определённое количество токенов в своём «уме» за раз, после чего начинает забывать начало!
Знаете ли вы?
У ИИ есть «окно контекста», которое похоже на размер его ладони. Оно может хранить только определённое количество токенов в своём «уме» за раз, после чего начинает забывать начало!
Загрузка...
⭐⭐⭐
Миссия выполнена!
Вы — мастер токенов!